Utilisation de croyances heuristiques pour la planification multi-agent dans le cadre des Dec-POMDP. (Using heuristic belief points for Dec-POMDP planning)
نویسنده
چکیده
منابع مشابه
Programmation dynamique à base de points pour la résolution des DEC-POMDPs
RÉSUMÉ. Nous présentons un nouvel algorithme de planification pour la construction de systèmes multi-agents réactifs et situés pouvant se modéliser par des processus de décision de Markov décentralisés (DEC-POMDP). Cet algorithme est fondé sur la programmation dynamique à base de points. Il est dérivé de techniques de programmation dynamique optimale utilisées pour résoudre des jeux stochastiqu...
متن کاملLes POMDP font de meilleurs hackers: Tenir compte de l'incertitude dans les tests de penetration
Résumé : Les tests de pénétration sont une méthodologie pour évaluer la sécurité d’un réseau en générant et exécutant de possibles attaques informatiques. Automatiser cette tâche permet de réaliser des tests réguliers et systématiques. Une question clef est : “Comment générer ces attaques ?” Ce problème se formule naturellement comme de la planification dans l’incertain, plus précisément avec u...
متن کاملHeuristique pour l’apprentissage automatique décentralisé d’interactions dans des systèmes multi-agents réactifs. Heuristics for automatic decentralized interaction learning in reactive multi-agent systems
This article proposes an heuristics for the automatic computation of interactions in reactive multi-agent system. It describes first the Interac-DEC-POMDP formalism and then focuses on a algorithm based on reinforcement learning techniques and distribution of individual rewards among agents to build interaction and collective behaviour in a sub-class of DEC-POMDP. These techniques produce adapt...
متن کاملPrise de décision en temps-réel pour des POMDP de grande taille
RÉSUMÉ. Cet article présente une méthode d’approximation pour les processus décisionnels de Markov partiellement observables (POMDP) qui est basée sur une recherche en profondeur pour la planification dans un environnement temps-réel dynamique. L’idée de base de notre approche, appelée RTBSS (Real-Time Belief Space Search), est d’éviter de calculer des politiques complètes pour des POMDPs. Cett...
متن کاملRévision des croyances dans un environnement multiagent : Une apprche basée sur la crédibilité et les arguments
Résumé Peu de recherches se sont penchées sur la problématique de la révision des croyances dans un cadre multiagent. En tout cas, à notre connaissance, aucune ne s'est penchée sur la révision des croyances tenant compte de la crédibilité des informateurs, tout en gardant trace des arguments en faveur de la révision, une fois celle-ci e ectuée. C'est ce problème qui nous a motivé et pour lequel...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2011